home *** CD-ROM | disk | FTP | other *** search
/ Shareware Overload Trio 2 / Shareware Overload Trio Volume 2 (Chestnut CD-ROM).ISO / dir39 / 2000tech.zip / 2200.TXT < prev    next >
Text File  |  1993-06-15  |  4KB  |  92 lines

  1. Document Number 2200
  2. Recognition Hints and Tips for Catchword
  3. 7/13/92
  4.  
  5. 1. Always scan in line-art or black and white mode.
  6.  
  7. 2. Selecting The Right Resolution:
  8.  
  9. Most magazines and textbooks should be scanned at 300 dpi. Use 400 dpi if
  10. the text you are scanning is smaller than standard magazine size.  For
  11. normal sized text (8 to 15 points), 300 dpi is the best resolution. Use 200
  12. dpi if you are scanning large blocks of headline-style type.
  13.  
  14.       Text Size          Scanner Resolution (DPI)
  15.     ----------------------------------------------
  16.     6  to 8  Points     400 DPI gives best results
  17.     9  to 15 Points     300 DPI gives best results
  18.     16 to 20 Points     200 DPI gives best results
  19.  
  20. 3. Adjusting Contrast:
  21.  
  22. Contrast control (the relative amounts of black and white) is critical
  23. in obtaining a good scan.  If the text to be scanned is too faint and the
  24. scanned image shows excessive broken characters, then recognition will
  25. be poor due to the unrecognized characters.  If the contrast is too dark,
  26. the letters will run together, also creating poor recognition.  In any
  27. initial scanning of a new image, you will need to adjust the contrast. We
  28. recommend beginning with the middle setting and then adjusting either way.
  29.  
  30. 4. Scanning Straight:
  31.  
  32. When the actual scan is slanted, skewed, or jagged, the text will not
  33. be recognized fully.  Use a hard edge ruler or the edge of a book to help
  34. scan straight.  Or press the left index finger on the left edge of the
  35. scanner window casing as your right hand is holding the scanner to scan.
  36. This will balance the weight of pressure in scanning and help align the scan
  37. direction straight down the material.  
  38.           
  39. 5. Scanning Speed:
  40.  
  41. For the best image quality, experiment with the scanning speed to 
  42. determine the best rate for your computer.  You should be scanning at an 
  43. acceptable rate so the speed indicator light on the scanner head does 
  44. not flash. When you scan too fast the characters may look compressed, which
  45. causes character size inconsistencies.  Try to scan a bit slower than the
  46. normal rate recommended by the scanner software, perhaps at about 1/2 to
  47. 1 inch per second. This way the system can receive and process all of the
  48. incoming scanned data in time.
  49.  
  50. Make sure your scanning does not get too far ahead of the real-time
  51. display.  On slower machines the disk access speed cannot keep up the with
  52. the rate of incoming data passed from the scanner to the machine channel.
  53. Before you hit RETURN to activate Recognition, view the entire image to check
  54. that all the data is captured to screen.  When you have scanned too fast for 
  55. the system, you may notice the final image displayed will have loss of data,
  56. i.e., certain chunks of paragraphs are missing. In this case, you will have
  57. to rescan slower.  Scanning too slowly will not affect the quality of the
  58. scanned image.
  59.  
  60. 6. Practice!
  61.  
  62. As you become more and more familiar with the way Catchword works -
  63. what it recognizes and what it doesn't - you will find your results increase
  64. dramatically.  
  65.  
  66. 7.  Full Page Scanning:
  67.  
  68. When attempting to scan a full page, scan the page in two strips with an
  69. overlap of 3/4 to 1 inch.  Scan both sides straight, at the same speed, and
  70. make sure both strips begin and end at the same height on the page.
  71.  
  72. You also have the option of scanning horizontally and the appending the
  73. strips together in a file. 
  74.  
  75. TROUBLESHOOTING:
  76.  
  77. Following are the most common reasons why an OCR program may misread text:
  78.  
  79. Unrecognizable fonts or characters.  Omnifont technology recognizes standard
  80. fonts by comparing text characters to features programmed into the software.
  81. The software will not read characters which don't match programmed features.
  82. It may also misread similar characters, for example 1 and l.
  83.  
  84. Original document quality directly affects accuracy.  Letters which are faint,
  85. touching or otherwise illegible may be read inaccurately. Newspapers, copies
  86. and faxes are often poor originals.
  87.  
  88. Uneven or fast scanning, or pausing in mid-scan may result in skewed,
  89. stretched or compressed text.  Follow the tips above to avoid these causes
  90. for misrecognition.
  91.           
  92.